년 2월 AI 및 로봇 연구 동향

년 2월 AI 및 로봇 연구 동향

1. 2018년 AI 및 로봇 공학 연구 지형 개관

2018년 초는 딥러닝 기술이 학문적 성공을 넘어 산업 전반으로 확산되며 성숙기에 접어든 중요한 시점이었다. 특히 심층 강화학습(Deep Reinforcement Learning)과 생성적 적대 신경망(Generative Adversarial Networks, GANs)과 같은 기술들은 기존의 한계를 돌파하며 새로운 연구의 지평을 열고 있었다.1 이러한 기술적 배경 하에서, 2018년 2월에 발표된 주요 연구들은 단순히 성능을 개선하는 것을 넘어, 알고리즘의 신뢰성을 확보하고 복잡한 현실 문제에 기술을 적용하려는 깊이 있는 시도를 보여주었다.

2018년 2월의 연구 동향은 크게 세 가지 축으로 요약할 수 있다. 첫째, 핵심 AI 알고리즘, 특히 강화학습 분야에서 안정성과 효율성을 근본적으로 개선하려는 노력이 두드러졌다. 둘째, 허위 정보 탐지, 의료, 금융 등 복잡하고 민감한 현실 세계의 문제에 AI 기술을 본격적으로 적용하려는 시도가 확산되었다.1 셋째, 로봇이 인간과 더 안전하고 긴밀하게 상호작용하고, 수중이나 우주와 같은 극한 환경을 극복하기 위한 물리적 구현 기술, 즉 하드웨어의 혁신이 가속화되었다.4 이 시기는 AI 연구가 ’가능성’의 단계를 지나 ’신뢰성’과 ’적용성’의 단계로 넘어가는 중요한 변곡점이었음을 시사한다. 초기 딥러닝의 성공이 특정 작업에서 인간을 능가하는 ’성능’을 입증하는 데 집중했다면, 2018년 2월의 연구들은 다른 차원의 질문을 던졌다. 예를 들어, 당대 최고의 AI 학회인 AAAI-18에서는 “신뢰할 수 있고 안전한 기계학습 시스템 공학“이 주요 주제로 다뤄졌고 7, 강화학습의 안정성을 정면으로 다룬 연구가 발표되었으며, 허위 정보 탐지 연구는 AI의 사회적 책임을 탐구했다. 이는 AI 시스템을 어떻게 신뢰할 수 있게 만들고, 어떻게 현실의 복잡한 문제에 책임감 있게 적용할 것인가에 대한 고민이 학계의 중심으로 이동하고 있음을 보여주는 필연적인 성숙 과정이라 할 수 있다.

본 보고서는 먼저 제32회 AAAI 학회를 통해 당대 주류 AI 연구의 흐름을 조망하고(II장), 이어서 강화학습 분야의 패러다임을 바꾼 두 개의 핵심 논문을 심층 분석한다(III장). 이후 로봇 공학의 물리적 혁신 사례들을 살펴보고(IV장), 마지막으로 이러한 기술 발전이 초래하는 사회경제적, 윤리적 함의를 고찰한다(V장).

2. 제32회 AAAI 인공지능 학회(AAAI-18) 주요 발표 동향

2.1 학회 개요 및 주요 연구 분야

제32회 AAAI 인공지능 학회(AAAI-18)는 2018년 2월 미국 뉴올리언스에서 개최되었으며, 당시 인공지능 연구의 최신 동향을 가늠할 수 있는 중요한 장이었다. 특히 제출된 논문의 70% 이상을 미국과 중국이 차지하며, 두 국가가 AI 연구 개발을 양적으로 주도하고 있음을 명확히 보여주었다.8 학회에서 진행된 주요 워크숍 주제들은 불완전 정보 게임, 기계학습 시스템의 신뢰성 및 보안 공학, 인간-기계 대화, 게임으로부터의 지식 추출 등 AI의 핵심 이론과 응용 분야를 폭넓게 포괄했다.7 이는 AI 연구가 특정 알고리즘의 성능 개선을 넘어, 보다 복잡하고 상호작용적인 문제, 그리고 기술의 신뢰성 문제로 확장되고 있음을 시사했다.

2.2 심층 분석: 소셜 미디어 허위 정보 조기 탐지 연구

AAAI-18에서 발표된 “Early Detection of Fake News on Social Media Through Propagation Path Classification with Recurrent and Convolutional Networks“는 당시의 기술적, 사회적 요구를 잘 보여주는 대표적인 연구다.9

  • 문제 정의: 소셜 미디어의 폭발적인 확산력으로 인해 허위 정보는 사회적 불신, 경제적 손실, 정치적 혼란 등 막대한 피해를 야기할 수 있다. 따라서 정보가 대중에게 널리 퍼지기 전, 즉 전파의 ’초기 단계’에 이를 신속하게 탐지하는 기술이 시급히 요구되었다.9 기존 연구들은 주로 뉴스의 텍스트 내용이나 사용자 댓글 같은 언어적 특징에 의존했으나, 이러한 정보는 초기 단계에서는 부족하거나 가짜 뉴스 유포자들에 의해 의도적으로 조작될 수 있다는 한계가 있었다.11

  • 기술적 접근: 이 연구는 허위 정보의 ’내용’이 아닌 ’전파 패턴’에 주목하는 혁신적인 접근법을 제시했다. 문제 자체를 텍스트 분류가 아닌 시계열 분류 문제로 재정의한 것이다.

  1. 전파 경로의 시계열 모델링: 연구진은 특정 뉴스를 전파하는 데 참여한 사용자들의 프로필 특성(계정 생성 시기, 팔로워 수, 트윗 수 등)을 시간 순서대로 배열하여 하나의 ‘다변량 시계열(multivariate time series)’ 데이터로 모델링했다.9

  2. RNN-CNN 결합 구조: 이렇게 생성된 시계열 데이터를 분석하기 위해 두 종류의 심층 신경망을 결합했다. 순환 신경망(RNN)은 전파 경로 전체에 걸쳐 나타나는 사용자 특성의 ’전역적 변화(global variations)’를 포착하고, 합성곱 신경망(CNN)은 짧은 시간 내에 군집을 이루는 특정 사용자 그룹의 ’지역적 특성 변화(local variations)’를 포착하는 데 사용되었다. 이 두 네트워크가 추출한 특징을 결합하여 최종적으로 해당 뉴스가 허위인지 아닌지를 분류했다.9

  • 성과와 의의: 이 모델은 실제 트위터와 시나 웨이보 데이터셋에서 뉴스가 퍼지기 시작한 지 단 5분 이내에 각각 85%와 92%라는 높은 정확도로 허위 정보를 탐지해냈다. 이는 기존 방식들보다 월등히 빠른 속도였다.9 이 연구는 조기 탐지 상황에서 신뢰하기 어려운 언어적 특징 대신, 상대적으로 조작이 어려운 사용자 프로필 특성의 동적인 전파 패턴을 활용하는 새로운 방향을 제시했다는 점에서 큰 학문적 의의를 지닌다.11 이는 AI 연구가 정적인 데이터의 패턴을 인식하는 것을 넘어, 정보 전파와 같은 사회적 시스템의 동역학(dynamics)을 모델링하는 방향으로 심화되고 있음을 보여주는 사례다.

2.3 주요 기술 트랙별 주목할 만한 연구 요약

AAAI-18의 다른 기술 트랙들에서도 AI 기술의 다각적인 발전이 확인되었다.2

  • 응용(Applications) 트랙: 피카소나 마티스의 작품인지, 혹은 위작인지를 감별하는 AI, 바이럴 마케팅에서 특정 콘텐츠가 과도하게 노출되는 현상을 완화하는 알고리즘, 그리고 알고리즘 의사결정에서 결과의 분배적 공정성을 넘어 ’절차적 공정성’을 확보하기 위한 특징 선택 방법론 등 AI 기술이 예술, 마케팅, 윤리 등 다양한 실제 도메인에 깊숙이 적용되는 사례들이 발표되었다.

  • 인지 모델링 및 시스템(Cognitive Modeling/Systems) 트랙: 인간과 유사한 독서 전략을 모방하여 문서 기반 질의응답을 수행하는 모델, 생물학적 뉴런의 동작 방식을 모사한 스파이킹 신경망의 학습 방법, 그리고 상식 추론 기반의 개방형 대화 시스템을 평가하기 위한 새로운 지표(RUBER) 등 인간의 인지 과정을 공학적으로 구현하거나 이해하려는 연구가 활발히 진행되었다.

  • 게임 이론 및 경제 패러다임(Game Theory and Economic Paradigms) 트랙: 다수의 대칭적 플레이어가 존재하는 게임을 회귀 분석으로 모델링하는 방법, 도구 경매(Tool Auctions) 이론, 그리고 다양한 투표 규칙 하에서 뇌물(bribery)의 계산 복잡도 분석 등 다수 행위자의 전략적 상호작용을 분석하는 연구들이 발표되었다. 이러한 연구들은 개별 데이터 포인트를 넘어, 행위자들의 상호작용으로 구성된 시스템의 동적 특성을 분석 대상으로 삼는다는 점에서 허위 정보 전파 연구와 맥을 같이 한다.

이러한 흐름은 AI가 단순히 데이터를 분류하고 예측하는 도구를 넘어, 사회, 경제, 인지 시스템의 복잡한 인과관계를 이해하고 시뮬레이션하는 과학적 도구로 발전하고 있음을 시사하는 중요한 변화였다.

연구 분야 (Research Area)핵심 문제 (Key Problem)대표 연구/방법론 (Representative Research/Methodology)의의 및 시사점 (Significance & Implication)
AI와 웹 (AI and the Web)소셜 미디어상 허위 정보의 신속하고 정확한 조기 탐지“Early Detection of Fake News…”
- 전파 경로의 다변량 시계열 모델링
- RNN과 CNN의 결합 구조
정보의 내용이 아닌 전파 패턴 분석이라는 새로운 패러다임 제시. AI의 사회적 책임 및 응용 가능성 확대.
응용 (Applications)다양한 현실 세계 문제에 대한 AI 기술의 적용 및 공정성 확보“Beyond Distributive Fairness…”
- 절차적으로 공정한 학습을 위한 특징 선택
예술품 감정, 마케팅 최적화 등 적용 분야 확장. 결과뿐 아니라 과정의 공정성을 고려하는 AI 윤리 연구 심화.
인지 모델링 (Cognitive Modeling)인간의 인지 과정(독서, 학습 등)을 모사하는 AI 모델 개발“A Unified Model for Document-Based Question Answering…”
- 인간과 유사한 독서 전략 기반 QA
AI가 인간의 지능을 더 깊이 이해하고 모방하려는 시도. 더 자연스러운 인간-기계 상호작용의 기반 마련.
게임 이론 (Game Theory)다수 행위자의 전략적 상호작용 및 집단적 의사결정 분석“A Regression Approach for Modeling Games With Many Symmetric Players”경제학, 사회과학적 현상을 AI로 분석. 복잡한 시스템의 동역학을 이해하는 도구로서의 AI 역할 부각.

3. 강화학습의 지평을 넓힌 핵심 연구

2018년 2월은 심층 강화학습 분야에서 두 개의 기념비적인 논문이 발표된 시기이기도 하다. 이 두 연구는 각각 강화학습의 근본적인 목표(‘무엇을’ 학습할 것인가)와 방법론(‘어떻게’ 학습할 것인가)에 대해 깊이 있는 해답을 제시하며 분야의 발전을 이끌었다.

3.1 보상 함수 없는 기술 학습: “Diversity is All You Need: Learning Skills without a Reward Function” (DIAYN)

  • 연구 목표: 강화학습의 가장 큰 난제 중 하나는 보상 설계 문제다. 현실 세계의 많은 문제들은 명시적인 보상 함수(reward function)가 없거나, 목표 달성 시에만 드물게 주어지는 희소한(sparse) 보상 환경이다. DIAYN 연구는 이러한 환경에서 외부의 보상 신호 없이 에이전트가 스스로 유용하고 다양한 ’기술(skill)’들을 비지도 방식(unsupervised)으로 학습하도록 하는 것을 목표로 했다.13 이는 강화학습의 고질적인 문제인 탐색(exploration)과 데이터 효율성을 해결하기 위한 근본적인 접근이었다.16

  • 핵심 방법론: 이 연구는 정보 이론(Information Theory)에 기반한 독창적인 목적 함수를 통해 내재적 동기(intrinsic motivation)를 구현했다.

  1. 정보 이론적 목적 함수: 에이전트의 목표는 ‘자신이 도달한 상태(S)를 보고 어떤 기술(Z, 잠재 변수)을 사용했는지 외부 관찰자가 쉽게 구별할 수 있도록’ 행동하는 것이다. 이는 상태와 기술 간의 상호 정보량(Mutual Information)을 최대화하는 것으로 공식화된다. 목적 함수는 다음과 같이 표현될 수 있다 14:
    \mathcal{F}(\theta) \triangleq I(S;Z)+\mathcal{H}-I(A;Z\vert S)

  2. 최대 엔트로피 정책: 동시에 각 기술 내에서는 최대한 예측 불가능하고 다양한 행동을 하도록 장려하기 위해, 상태가 주어졌을 때 행동의 엔트로피(\mathcal{H})를 최대화하는 최대 엔트로피 정책을 사용한다.14

  3. 내재적 보상: 이 복잡한 목적 함수를 최적화하기 위해, 에이전트는 외부 보상 대신 다음과 같은 내재적 보상(intrinsic reward)을 받는다. 여기서 q_{\phi}(z\vert s)는 현재 상태 s로부터 기술 z를 추론하는 판별자(discriminator) 네트워크다.14
    r_{t}=\log q_{\phi}(z\vert s_{t+1})-\log p(z)
    즉, 에이전트는 판별자가 자신이 사용한 기술을 쉽게 알아볼 수 있는 상태로 이동할 때마다 보상을 받는다.

  • 연구 성과 및 의의: 이 방법을 통해 연구진은 시뮬레이션된 로봇 환경에서 어떠한 외부 보상도 주지 않았음에도 불구하고, 로봇이 스스로 걷기, 점프하기, 뒤집기 등 의미 있고 다양한 기술들을 자발적으로 학습하는 것을 보였다.16 이는 강화학습이 ’보상 극대화’라는 좁은 프레임에서 벗어나, ’세상에 대한 다양한 기술의 습득’이라는 보다 일반적인 학습 프레임으로 확장될 수 있음을 증명한 것이다. 이 연구는 이후 자기 지도 학습(self-supervised learning)과 비지도 강화학습 연구에 지대한 영향을 미쳤다.17

3.2 액터-크리틱 방법론의 안정성 강화: “Addressing Function Approximation Error in Actor-Critic Methods” (TD3)

  • 연구 목표: 심층 Q-러닝(Deep Q-learning)에서 심층 신경망이라는 강력하지만 불안정한 함수 근사기를 사용할 때 발생하는 ‘가치 과대평가 편향(overestimation bias)’ 문제는 잘 알려져 있었다. 이 논문은 이러한 문제가 연속 행동 공간(continuous action space)의 액터-크리틱(Actor-Critic) 방법론에서도 동일하게 발생하며, 이로 인해 학습이 불안정해지고 차선의 정책을 학습하게 되는 문제를 해결하는 것을 목표로 했다.13

  • 핵심 방법론: 연구진은 기존의 DDPG 알고리즘을 대폭 개선한 TD3(Twin Delayed Deep Deterministic policy gradient) 알고리즘을 제안했다. TD3는 구현이 간단하면서도 매우 효과적인 세 가지 핵심 기법으로 구성된다.

  1. Clipped Double Q-learning: 두 개의 독립적인 크리틱(Q-함수) 네트워크를 동시에 학습시키고, 벨만 업데이트를 위한 타겟 값을 계산할 때 두 네트워크의 예측값 중 더 작은 값을 사용한다. 이는 가치 추정치가 과도하게 부풀려지는 것을 직접적으로 억제하는 역할을 한다.20 타겟 값 y는 다음과 같이 계산된다 20:
    y = r + \gamma \min_{i=1,2} Q_{\theta'_i}(s', \pi_{\phi'}(s'))

  2. 지연된 정책 업데이트 (Delayed Policy Updates): 액터(정책) 네트워크를 크리틱 네트워크보다 더 낮은 빈도로 업데이트한다 (예: 크리틱은 매 스텝, 액터는 두 스텝마다). 이는 크리틱의 가치 추정치가 어느 정도 안정된 후에 정책을 개선하도록 하여 학습 과정의 분산을 줄인다.20

  3. 타겟 정책 평활화 (Target Policy Smoothing): 타겟 액터가 선택한 행동에 작은 무작위 노이즈를 추가한다. 이는 가치 함수가 특정 행동에 대해 과적합되어 날카로운 피크(peak)를 형성하는 것을 방지하고, 학습을 부드럽게 만드는 정규화(regularization) 효과를 준다.21

  • 연구 성과 및 의의: TD3는 OpenAI Gym의 여러 연속 제어 벤치마크 환경에서 당시의 모든 최첨단(State-of-the-Art) 알고리즘을 압도하는 성능을 보였다.25 TD3가 제시한 세 가지 기법은 구현이 간단하면서도 효과가 뛰어나, 이후 수많은 오프-폴리시(off-policy) 심층 강화학습 알고리즘의 사실상 표준(de facto standard) 구성 요소가 되었다.21 이 연구는 강화학습 연구의 초점을 새로운 신경망 아키텍처 설계에서, 기존 알고리즘의 안정성과 신뢰성을 높이는 공학적 개선으로 전환시키는 데 크게 기여했다.

이 두 연구는 상호 보완적인 관계를 가진다. 강화학습의 근본적인 문제는 (1) 에이전트가 ‘무엇을’ 학습해야 하는가(보상 설계)와 (2) 주어진 목표를 ‘어떻게’ 안정적으로 학습할 것인가(알고리즘 안정성)로 나눌 수 있다. DIAYN은 보상을 인간이 설계하는 대신 ‘다양한 기술 습득’ 자체가 내재적 목표가 될 수 있음을 보여줌으로써 첫 번째 질문에 대한 새로운 관점을 제시했다. 반면, TD3는 주어진 목표가 있을 때, 심층 신경망을 사용하여 ‘어떻게’ 그 목표를 안정적으로 달성할 수 있는지에 대한 정교한 공학적 해법을 제시하며 두 번째 질문에 답했다. 이들은 함께 강화학습이 더 일반적이고 안정적인 지능으로 나아가기 위한 두 개의 필수적인 축을 대표한다.

구분 (Category)DIAYN (Diversity is All You Need)TD3 (Addressing Function Approx. Error)
연구 목표비지도 방식의 자율적 기술 습득액터-크리틱 방법론의 학습 안정성 강화
핵심 문제희소 보상 환경에서의 탐색 문제함수 근사로 인한 가치 과대평가 편향
제안 방법론정보 이론적 목적 함수 (상호 정보량 최대화)Clipped Double Q-learning, 지연된 정책 업데이트, 타겟 정책 평활화
보상 함수내재적 보상 (Intrinsic Reward)외재적 보상 (Extrinsic Reward)
주요 기여학습 목표(‘What’)의 패러다임 전환학습 방법(‘How’)의 안정성 및 신뢰성 확보

4. 로봇 공학 및 구현 기술의 혁신

2018년 2월의 로봇 공학 연구들은 추상적인 AI 알고리즘을 현실 세계에 성공적으로 안착시키기 위한 다각적인 노력을 보여주었다. 이는 ’지능의 물리적 구현(Embodiment of Intelligence)’이라는 공통된 주제 아래, 하드웨어(소재), 소프트웨어(인식/협업), 그리고 학습 패러다임이 삼위일체가 되어 발전해야 함을 명확히 보여주었다.

4.1 자가 회복 및 재활용 가능한 전자 피부(E-skin) 개발

  • 기술 개요: 미국 콜로라도 대학교 볼더 캠퍼스 연구팀은 인간의 피부처럼 유연하고, 손상 시 스스로 치유되며, 수명이 다하면 완전히 재활용할 수 있는 혁신적인 전자 피부(e-skin)를 개발했다.6 이 전자 피부에는 압력, 온도, 습도, 공기 흐름을 감지하는 센서가 내장되어 있어 로봇에게 풍부한 촉각 정보를 제공할 수 있다.29

  • 핵심 소재 분석:

  • 폴리이민(Polyimine): 이 전자 피부의 핵심 기반 소재는 동적 공유 결합(dynamic covalent bond)이라는 특수한 화학적 결합을 가진 고분자인 폴리이민이다. 이 결합은 외부 자극 없이도 상온에서 쉽게 끊어지고 다시 형성될 수 있어, 소재의 자가 회복과 재활용을 가능하게 하는 핵심적인 역할을 한다.27

  • 은 나노입자(Silver Nanoparticles): 폴리이민 고분자 네트워크에 미세한 은 나노입자를 첨가하여 전기 전도성을 부여했다. 이를 통해 소재가 센서로서 기능할 수 있게 되며, 동시에 기계적 강도와 화학적 안정성도 향상시킨다.27

  • 작동 원리:

  • 자가 회복: 전자 피부가 절단되거나 손상되면, 세 가지 상용 화합물이 섞인 에탄올 용액을 이용해 손상된 부분의 폴리이민 네트워크를 재결합시킬 수 있다. 이를 통해 물리적 구조뿐만 아니라 내장된 센서의 기능까지 복원된다.27

  • 재활용: 수명이 다한 전자 피부를 특정 재활용 용액에 담그면, 폴리이민 고분자가 기본 단위인 단량체(monomer)와 과량체(oligomer)로 분해되어 용해된다. 이때 은 나노입자는 바닥에 가라앉게 되는데, 이들을 각각 회수하여 새로운 전자 피부를 만드는 데 완벽하게 재사용할 수 있다.27

  • 로봇 공학 응용 가능성: 이 기술은 로봇이 인간 및 환경과 물리적으로 상호작용하는 방식을 근본적으로 바꿀 잠재력을 가진다. 예를 들어, 아기를 돌보는 로봇의 손가락에 부착하여 섬세한 압력 감지를 통해 안전성을 높이거나, 인간과 협업하는 산업용 로봇이 충돌 시 상호 피해를 줄일 수 있다. 또한, 손상 시 스스로 수리하는 기능을 통해 의수나 로봇 손의 유지보수 비용을 획기적으로 절감할 수 있다.27

4.2 극한 환경 극복을 위한 로봇 기술

지능이 물리적 한계에 부딪혔을 때, 이를 극복하기 위한 특화된 인식 알고리즘과 협업 전략이 필요함을 보여주는 연구들도 발표되었다.

  • 수중 환경에서의 시각 지능: 수중에서는 빛의 산란과 흡수로 인해 이미지가 뿌옇게 변하고 특정 색(청록색)으로 왜곡되어 로봇의 항법 및 인식 능력이 크게 저하된다.32 2018년 2월 국제 학술지 Robotics에 발표된 한 연구는 대기 중의 안개를 제거하는 데 사용되던 Dark Channel Prior 모델을 수중 환경에 맞게 변형하고, 환경 인식 모듈을 추가하여 다양한 탁도의 수중 이미지의 색상과 선명도를 효과적으로 복원하는 알고리즘을 제시했다.32 수중 이미지 형성 모델은 다음과 같이 표현될 수 있다 33:
    L_r = t(\mathbf{x}) L_p + A' (1 - t(\mathbf{x}))
    이 연구는 수중 탐사 로봇의 자율 항법 능력 향상에 직접적으로 기여할 수 있는 실용적인 해결책을 제공했다.

  • 혹독한 지형 탐사를 위한 협업 로봇: 펜실베이니아 대학교(Penn Engineering)의 TRUSSES 프로젝트는 달이나 화성과 같은 험준한 지형을 탐사하기 위해 단일 로봇이 아닌 다중 로봇 협업 시스템을 제안했다. 이 프로젝트에서는 다리가 있어 모래를 파고들 수 있지만 쉽게 넘어지는 로봇과, 안정적이지만 미끄러지기 쉬운 바퀴형 로버를 물리적으로 연결하여 서로의 단점을 보완했다. 이 협업 시스템은 개별 로봇으로는 오를 수 없었던 가파른 모래 언덕을 함께 오르는 데 성공했다.5 이는 단일의 완벽한 로봇을 설계하는 대신, 기능적으로 분화된 로봇들의 협력을 통해 시스템 전체의 강인성(robustness)을 높이는 새로운 로봇 설계 철학을 보여준다.

4.3 집단 지능 및 자율 시스템 연구 동향

  • 체화된 진화(Embodied Evolution): 로봇 집단이 중앙 통제 없이, 실제 환경과의 상호작용을 통해 온라인으로 행동 제어기를 스스로 설계하고 적응해 나가는 ’체화된 진화(Embodied Evolution)’가 로봇 군집을 위한 분산형 온라인 학습 방법으로 주목받기 시작했다.34 이는 학습 과정 자체가 물리적 상호작용을 통해 이루어져야 한다는 ‘체화된 인지(Embodied Cognition)’ 철학을 반영하며, 개별 로봇의 자율성을 넘어 집단 전체가 자율적으로 학습하고 진화하는 고차원의 자율성을 추구하는 연구 방향이다.

  • 인간-로봇 협업(Human-Robot Collaboration): 로봇 제어 루프에 인간을 포함시켜, 로봇의 자율성과 인간의 직관 및 판단력을 결합하려는 연구가 활발히 진행되었다. 이는 로봇 인식, 자율 항법, 조작 기술의 발전을 요구하는 동시에, 인간과 로봇 간의 원활한 상호작용을 위한 새로운 기술적 과제를 제시했다.4

5. AI와 로봇 기술의 사회경제적 영향과 전망

2018년은 AI 기술의 폭발적인 발전이 가져올 ‘낙관론’(경제 성장)과 ‘비관론’(불평등, 윤리적 위기)이 사회 담론의 장에서 본격적으로 충돌하기 시작한 시점이었다. 기술 자체에 집중하는 학술 논문과 달리, 이 시기 주요 기관들의 보고서는 기술이 사회에 미치는 영향에 초점을 맞추었다.

5.1 자동화의 거시 경제적 파급 효과

주요 경제 분석 기관들은 AI와 로봇 기술이 가져올 막대한 생산성 향상과 경제적 이익을 예측하며 기술에 대한 낙관론을 제시했다.

  • GDP 성장 기여: PwC는 AI, 로봇 공학 등 스마트 자동화 기술이 2030년까지 전 세계 GDP를 최대 14%, 금액으로는 약 15조 달러까지 끌어올릴 잠재력이 있다고 분석했다.35 McKinsey 역시 AI가 2030년까지 약 13조 달러의 추가적인 경제 생산을 창출하고, 연간 글로벌 GDP를 1.2%씩 지속적으로 성장시킬 것으로 예측했다.36

  • 고용 시장의 변화: 자동화로 인한 일자리 소멸에 대한 대중의 우려(PwC 설문조사에서 노동자의 37%가 우려 표명)가 컸지만, 장기적으로는 기술 발전이 창출하는 새로운 경제 규모 덕분에 사라지는 일자리가 새로운 일자리로 상쇄될 것이라는 전망도 제기되었다.35 산업별로는 금융 서비스가 단기적으로, 운송 분야가 장기적으로 자동화에 취약할 것으로 분석되었다.35 한편, IMF는 일본 사례 분석을 통해 로봇 밀도 증가가 생산성 향상뿐만 아니라, 해당 지역의 고용과 임금에도 전반적으로 긍정적인 영향을 미쳤다는 실증적 결과를 발표하기도 했다.3

5.2 기술 채택과 불평등 심화

그러나 바로 그 보고서들 내부에서 이익의 총량은 커지지만, 그 분배는 매우 불균등할 수 있다는 경고가 제기되었다.

  • S-커브 채택 패턴: AI 기술의 도입은 높은 초기 투자 비용과 학습 곡선으로 인해 느리게 시작되다가, 경쟁 심화와 기술 성숙에 따라 급격히 가속화되는 S-커브 패턴을 보일 것으로 예상되었다.36

  • 격차 심화: AI 기술 도입 속도와 활용 능력의 차이로 인해 국가, 기업, 노동자 간의 격차가 확대될 수 있다는 우려가 제기되었다. McKinsey는 AI 선도국이 후발국보다 20~25% 더 많은 경제적 이익을 얻을 수 있는 반면, 개발도상국은 잠재 이익의 절반밖에 얻지 못할 수 있다고 분석했다.36 이는 AI가 글로벌 경제의 양극화를 심화시킬 위험을 내포하고 있음을 시사한다.

5.3 윤리적 및 사회적 과제

기술 발전이 인간의 자율성, 책임, 생명이라는 근본적인 가치와 충돌할 수 있음을 보여주는 윤리적 논쟁 또한 본격화되었다.

  • 자율살상무기(LAWS) 논쟁: AI 기술의 발전은 ’킬러 로봇’으로 불리는 자율살상무기(Lethal Autonomous Weapon Systems) 개발 가능성을 높이며 심각한 윤리적 논쟁을 촉발했다.37 핵심 쟁점은 이러한 무기 시스템이 야기하는 피해에 대한 ‘책임 공백(responsibility gap)’ 문제, 즉 오작동 시 누구에게 책임을 물을 것인가 하는 문제와, 인간의 직접적인 개입 없이 기계가 인간의 생사를 결정하는 것에 대한 근본적인 윤리적 우려였다. 이에 대응하여, 무기 시스템의 작동 과정에 항상 인간이 결정적인 통제권을 가져야 한다는 ‘의미 있는 인간 통제(Meaningful Human Control)’ 개념이 중요한 원칙으로 제시되었다.37

  • 법 집행 분야에서의 AI 활용: AI와 로봇 기술은 범죄 예측 및 수사 효율성을 높일 잠재력을 가지지만, 동시에 인권, 공정성, 책임성, 투명성, 설명가능성 측면에서 근본적인 도전 과제를 제기한다. UN 산하 기구인 UNICRI와 인터폴(INTERPOL)은 공동 보고서를 통해, AI의 악의적 사용(디지털, 물리적, 정치적 공격)에 대한 법 집행 기관의 대비가 필요함을 역설하는 한편, 법 집행 과정에서의 AI 사용이 반드시 인권 기준과 일치해야 함을 강조했다.38

이러한 논의들은 2018년 2월이 기술 개발자들이 순수한 기술적 성취에만 몰두할 수 없게 된 시기임을 보여준다. 자신들이 개발한 기술이 가져올 사회경제적 파급 효과와 윤리적 함의에 대한 성찰이 더 이상 선택이 아닌 필수가 되었음을 알리는 중요한 전환점이었다.

6. 결론: 2018년 2월 연구의 종합적 의의 및 향후 전망

2018년 2월은 AI 연구의 내실을 다지고 외연을 확장하는 중요한 시기였다. 내부적으로는 TD3와 같은 연구를 통해 강화학습 알고리즘의 안정성과 신뢰성을 확보했고, DIAYN과 같은 연구를 통해 학습의 근본적인 패러다임에 대한 탐구가 이루어졌다. 외부적으로는 허위 정보 탐지, 로봇 공학, 경제 분석 등 AI를 현실 세계의 복잡한 문제에 적용하려는 노력이 전방위적으로 확산되었다. 이러한 성과들은 현재 AI 기술의 발전에 지대한 영향을 미쳤다.

DIAYN에서 제시된 내재적 동기 부여와 비지도 기술 학습의 개념은 오늘날 대규모 언어 모델(LLM)이 방대한 텍스트 데이터로부터 스스로 지식을 학습하는 자기 지도 학습(self-supervised learning) 패러다임의 중요한 철학적 토대가 되었다. TD3가 정립한 액터-크리틱 안정화 기법들은 현재 최첨단 강화학습 알고리즘인 SAC(Soft Actor-Critic) 등 수많은 후속 연구에 계승 및 발전되어, 로봇 제어, 자원 관리 등 실제 문제 해결에 핵심적으로 활용되고 있다. 또한, 전자 피부와 같은 소프트 로보틱스 연구는 지속적으로 발전하여 현재는 의료용 웨어러블 기기 및 인간-로봇 상호작용 분야에서 중요한 연구 흐름을 형성하고 있다.

결론적으로, 2018년 2월에 제기된 기술적, 사회적, 윤리적 화두들은 오늘날에도 여전히 유효하며 그 중요성이 더욱 커졌다. 기술의 발전은 가속화되었지만, 그에 따른 사회적 격차, 책임 소재, 인간 통제와 같은 문제는 여전히 해결해야 할 중대한 과제로 남아있다. 따라서 당시의 연구들을 되돌아보는 것은 현재 우리가 직면한 AI 시대의 과제들의 뿌리를 이해하고, 기술 발전과 사회적 가치가 조화를 이루는 미래를 모색하는 데 중요한 통찰을 제공한다.

7. 참고 자료

  1. SQ2. What are the most important advances in AI? | One Hundred Year Study on Artificial Intelligence (AI100) - Stanford University, https://ai100.stanford.edu/gathering-strength-gathering-storms-one-hundred-year-study-artificial-intelligence-ai100-2021-1/sq2
  2. Thirty-Second AAAI Conference on Artificial Intelligence 2018 Archives, https://aaai.org/proceeding/01-thirty-second-aaai-conference-on-artificial-intelligence-2018/
  3. Managing Japan’s Shrinking Labor Force With AI and Robots - IMF F&D Magazine - June 2018 | Volume 55 | Number 2, https://www.imf.org/en/Publications/fandd/issues/2018/06/japan-labor-force-artificial-intelligence-and-robots-schneider
  4. Robotics and Autonomous Intelligent Machines - Research - Cardiff University, https://www.cardiff.ac.uk/research/explore/research-units/robotics-and-autonomous-intelligent-machines
  5. Helping robots work together to explore the Moon and Mars - Penn Engineering Blog, https://blog.seas.upenn.edu/helping-robots-work-together-to-explore-the-moon-and-mars/
  6. [반도체가 만드는 세상] 인간과 똑같은 인공지능 로봇 ‘휴머노이드(Humanoid)’, https://news.skhynix.co.kr/robot-humanoid/
  7. AAAI Workshop Papers 2018 Archives - The Association for the Advancement of Artificial Intelligence, https://aaai.org/proceeding/aaaiw-18/
  8. Number of accepted and submitted papers at the 2018 AAAI Conference… - ResearchGate, https://www.researchgate.net/figure/Number-of-accepted-and-submitted-papers-at-the-2018-AAAI-Conference-Shoham-et-al-2018_fig6_338402593
  9. Early Detection of Fake News on Social Media Through Propagation …, https://cdn.aaai.org/ojs/11268/11268-13-14796-1-2-20201228.pdf
  10. Early Detection of Fake News on Social Media Through Propagation Path Classification with Recurrent and Convolutional Networks - AAAI Publications, https://ojs.aaai.org/index.php/AAAI/article/view/11268
  11. Early Detection of Fake News on Social Media Through Propagation Path Classification with Recurrent and Convolutional Networks - ResearchGate, https://www.researchgate.net/publication/329590584_Early_Detection_of_Fake_News_on_Social_Media_Through_Propagation_Path_Classification_with_Recurrent_and_Convolutional_Networks
  12. Early Detection of Fake News on Social Media Through Propagation Path Classification with Recurrent and Convolutional Networks | Semantic Scholar, https://www.semanticscholar.org/paper/Early-Detection-of-Fake-News-on-Social-Media-Path-Liu-Wu/d124b561ea719ab3bca419336d5d9c8a6c5f7ae8
  13. Top 1422 arXiv: Artificial Intelligence papers published in 2018 - SciSpace, https://scispace.com/journals/arxiv-artificial-intelligence-2qlw4xp2/2018
  14. [1802.06070] Diversity is All You Need: Learning Skills without a …, https://ar5iv.labs.arxiv.org/html/1802.06070
  15. Diversity is all you need: Learning skills without a reward function - Princeton University, https://collaborate.princeton.edu/en/publications/diversity-is-all-you-need-learning-skills-without-a-reward-functi
  16. Diversity is All You Need - Google Sites, https://sites.google.com/view/diayn/
  17. Diversity is All You Need: Learning Skills without a Reward Function - Semantic Scholar, https://www.semanticscholar.org/paper/Diversity-is-All-You-Need%3A-Learning-Skills-without-Eysenbach-Gupta/5b01eaef54a653ba03ddd5a978690380fbc19bfc
  18. [1802.06070] Diversity is All You Need: Learning Skills without a Reward Function - arXiv, https://arxiv.org/abs/1802.06070
  19. Diversity is All You Need: Learning Skills without a Reward Function - OpenReview, https://openreview.net/forum?id=SJx63jRqFm
  20. Addressing Function Approximation Error in Actor-Critic Methods, https://proceedings.mlr.press/v80/fujimoto18a/fujimoto18a.pdf
  21. Addressing Function Approximation Error in Actor-Critic Methods - ResearchGate, https://www.researchgate.net/publication/323410756_Addressing_Function_Approximation_Error_in_Actor-Critic_Methods
  22. Improving Actor-Critic Training with Steerable Action-Value Approximation Errors - arXiv, https://arxiv.org/html/2406.03890v2
  23. Addressing Function Approximation Error in Actor-Critic Methods: Supplementary Material - Proceedings of Machine Learning Research, http://proceedings.mlr.press/v80/fujimoto18a/fujimoto18a-supp.pdf
  24. [PDF] Addressing Function Approximation Error in Actor-Critic Methods - Semantic Scholar, https://www.semanticscholar.org/paper/Addressing-Function-Approximation-Error-in-Methods-Fujimoto-Hoof/4debb99c0c63bfaa97dd433bc2828e4dac81c48b
  25. [1802.09477] Addressing Function Approximation Error in Actor-Critic Methods - arXiv, https://arxiv.org/abs/1802.09477
  26. All News | Paul M. Rady Mechanical Engineering | University of Colorado Boulder, https://www.colorado.edu/mechanical/taxonomy/term/14?page=50
  27. New malleable ‘electronic skin’ self-healable, recyclable …, https://www.sciencedaily.com/releases/2018/02/180209170717.htm
  28. Science & Technology | CU Boulder Today, https://www.colorado.edu/today/taxonomy/term/6?page=44
  29. New malleable ‘electronic skin’ self-healable, recyclable | CU Boulder Today, https://www.colorado.edu/today/2018/02/09/new-malleable-electronic-skin-self-healable-recyclable
  30. Self-Healing Materials-Based Electronic Skin: Mechanism, Development and Applications, https://pmc.ncbi.nlm.nih.gov/articles/PMC9222937/
  31. Mechanics of Materials - University of Colorado Boulder, https://www.colorado.edu/mechanical/taxonomy/term/180?page=1
  32. Robotics, Volume 7, Issue 1 (March 2018) – 14 articles, https://www.mdpi.com/2218-6581/7/1
  33. An Underwater Image Enhancement Algorithm for Environment …, https://www.mdpi.com/2218-6581/7/1/14
  34. Embodied Evolution in Collective Robotics: A Review - Frontiers, https://www.frontiersin.org/journals/robotics-and-ai/articles/10.3389/frobt.2018.00012/full
  35. Will robots really steal our jobs? - PwC UK, https://www.pwc.co.uk/economic-services/assets/international-impact-of-automation-feb-2018.pdf
  36. NOTES FROM THE AI FRONTIER MODELING THE IMPACT OF AI ON THE WORLD ECONOMY - McKinsey, https://www.mckinsey.com/~/media/mckinsey/featured%20insights/artificial%20intelligence/notes%20from%20the%20frontier%20modeling%20the%20impact%20of%20ai%20on%20the%20world%20economy/mgi-notes-from-the-ai-frontier-modeling-the-impact-of-ai-on-the-world-economy-september-2018.ashx
  37. Meaningful Human Control over Autonomous Systems: A Philosophical Account - Frontiers, https://www.frontiersin.org/journals/robotics-and-ai/articles/10.3389/frobt.2018.00015/full
  38. Artificial Intelligence and Robotics for Law Enforcement | UNICRI :: United Nations Interregional Crime and Justice Research Institute, https://unicri.org/artificial-intelligence-and-robotics-law-enforcement